Guía de programación AMD HIP: Fundamentos arquitectónicos del ecosistema HIP

El Ecosistema HIP está diseñado como una capa de abstracción ligera para garantizar la compatibilidad de código fuente entre las arquitecturas de AMD y NVIDIA. Utiliza el ROCm (Radeon Open Compute) pila, específicamente aprovechando el arquitectura de sistema heterogéneo (HSA) entorno de tiempo de ejecución y el controlador de fusión de kernels (KFD).

1. Inicialización inicial

La inicialización comienza con intercambios de mensajes de bajo nivel entre controladores de kernel mediante hsa_init(0, ...) y hsaKmtOpenKFD(...). Estas llamadas de establecimiento crean el puente de comunicación entre las aplicaciones en espacio de usuario y el hardware de GPU de AMD.

2. Descubrimiento de topología y propiedades

Antes de lanzar kernels, el entorno de tiempo de ejecución identifica las capacidades del hardware usando hsaKmtAcquireSystemProperties y hsaKmtGetNodeProperties. Mapea la memoria física a nodos de GPU usando hsaKmtMapMemoryToGPUNodes, asegurando la visibilidad de la tabla de páginas para el dispositivo.

3. El pipeline de compilación

El puente entre CUDA y HIP se basa en dos pilares: hipify-perl (transpilador basado en expresiones regulares) y hipcc (envoltorio de compilador).

# Ejemplo de flujo de portabilidad
hipify-perl square.cu > square.cpp
hipcc square.cpp -o square.out

4. Lógica de versiones

La compatibilidad se garantiza mediante una fórmula precisa para asegurar que hipRuntimeGetVersion coincida con las tablas de extensiones HSA:

$$\text{HIP\_VERSION} = \text{MAJOR} \times 10^7 + \text{MINOR} \times 10^5 + \text{PATCH}$$

TERMINALbash — 80x24

> Ready. Click "Run" to execute.

QUESTION 1

Which tool converts CUDA (.cu) files into HIP-ready C++ (.cpp) files via regex mapping?

hipcc

hipify-perl

hsa_init

rocminfo

QUESTION 2

What is the primary purpose of the Kernel Fusion Driver (KFD) in this architecture?

To compile device-side ISA code.

To manage user-space to GPU communication and page table mapping.

To calculate the HIP_VERSION macro.

To provide high-level math intrinsics.

QUESTION 3

Given the formula, what is the value of HIP_VERSION for major version 6, minor 0, and patch 325?

600325

60032500

60000325

60032500 (6*10^7 + 0*10^5 + 325)

QUESTION 4

Which low-level HSA function must be called to establish the system-wide runtime context?

hsa_init(0, ...)

hsaKmtAllocMemory(...)

hsaKmtCreateEvent(...)

hsa_agent_iterate_is_pas(...)

QUESTION 5

What does hsa_system_get_major_extension_table do?

It links HIP API calls to the specific HSA implementation on the host.

It converts CUDA code to C++.

It allocates 4096-byte buffers.

It releases KMT system properties.